|
In den letzten Jahren wurden die Techniken zur Datenerhebung und
Speicherung stark weiterentwickelt. Zum Beispiel führen Barcodes
auf nahezu allen Produkten und die Automatisierung von
Betriebsabläufen zu immer grösseren Datenmengen, die interpretiert
werden müssen. Das Problem liegt darin, dass eine grosse Menge von
Information vorhanden ist, das darin enthaltene Wissen jedoch
aufgrund der grossen Datenmenge nicht zugänglich ist. Daraus ergibt
sich die Notwendigkeit zur Entdeckung von Wissen in grossen
Datenbanken (Knowledge Discovery in Databases, Data Mining).
Grundlage des in dieser Diplomarbeit vorgestellten Verfahrens ist
das angenäherte nichtmonotone ILP (Inductive Logic Programming).
Gefunden werden Hornformeln, wobei eine Menge von Rumpfliteralen vom
Benutzer angegeben werden muss. Die Qualität von gefundenen
Klauseln wird von den Messwerten Support und Confidence bestimmt.
Hauptsächlich beschäftigt sich die Diplomarbeit mit der
Erweiterung eines bestehenden ILP-Verfahrens um eine Komponente, die
numerische Attribute behandeln kann
|